
1M长上下文,满血版Gemini 2.0又一次登上Chatbot Arena榜首
1M长上下文,满血版Gemini 2.0又一次登上Chatbot Arena榜首就在国内各家大模型厂商趁年底疯狂卷的时候,太平洋的另一端也没闲着。 就在今天,谷歌发布了 Gemini 2.0 Flash Thinking 推理模型的加强版,并再次登顶 Chatbot Arena 排行榜。
来自主题: AI资讯
8822 点击 2025-01-22 18:40
就在国内各家大模型厂商趁年底疯狂卷的时候,太平洋的另一端也没闲着。 就在今天,谷歌发布了 Gemini 2.0 Flash Thinking 推理模型的加强版,并再次登顶 Chatbot Arena 排行榜。
用来运行 Llama 3 405B 优势明显。
基于评测维度,考虑到各评测集关注的评测维度,可以将其划分为通用评测基准和具体评测基准。